Estratégias de Atualização de Políticas para a Coordenação de Agentes Baseados em Enxames
نویسندگان
چکیده
Resumo. Neste artigo é analisada a influência dos parâmetros de aprendizagem de algoritmos baseados em enxames e propostas estratégias para a atualização de políticas em ambientes dinâmicos. Nós verificamos que os parâmetros de aprendizagem quando ajustados inadequadamente podem ocasionar atrasos no processo de aprendizagem ou convergir para uma política não-satisfatória. Além disso, esse problema é agravado em ambientes dinâmicos, pois o ajuste dos parâmetros de algoritmos que utilizam recompensas não é suficiente para garantir uma boa convergência. Para tal problema, nós desenvolvemos estratégias de atualização de políticas que modificam os valores das recompensas, melhorando a coordenação dos agentes que atuam em ambientes dinâmicos. Para isso, foi desenvolvido um framework capaz de demonstrar de maneira iterativa a influência dos parâmetros e das estratégias de atualizações. Resultados experimentais mostram que é possível acelerar a convergência para uma política global consistente, superando os resultados de abordagens clássicas de algoritmos baseados em enxames.
منابع مشابه
SEMISH XXXIII Seminário Integrado de Software e Hardware
This paper presents a novel methodology to evaluate the performance of adaptive autonomous agents. Measuring the performance of a learning agent is not a trivial task and it generally requires lengthy simulations as well as knowledge about the domain. A generic evaluation methodology has been developed to precisely evaluate the performance of the Q-learning algorithm and estimation policy techn...
متن کاملLTI Agent Rescue: A Partial Global Approach for the RoboCup Rescue Task Allocation
Coordenação é um dos principais problemas em sistemas multiagentes, além de também desempenhar um papel essencial na gestão de desastres. A alocação de tarefas é uma fase importante do problema de coordenação, já que a decomposição de um objetivo em tarefas é a forma mais natural para se organizar o trabalho entre agentes. Nesse artigo, é proposta uma abordagem híbrida de alocação de tarefas pa...
متن کامل[Vaccines and campaigns: images with a story to tell].
A iconografia em torno das vacinas e das campanhas de vacinação constitui importante acervo para aqueles que se interessam pela temática das políticas de imunização. Nela, muitas vezes, estão presentes diversas representações sobre as vacinas e as doenças por elas combatidas; os ambientes onde as vacinações eram postas em prática; os veículos e as estratégias de convencimento e comunicação de m...
متن کاملMolecular Materials and Devices: Developing New Functional Systems Based on the Coordination Chemistry Approach
Neste limiar da era nanotecnológica, o planejamento molecular dos materiais e os estudos de moléculas isoladas estão abrindo imensas possibilidades no emprego de sistemas moleculares em dispositivos eletrônicos e fotônicos, bem como em aplicações tecnológicas baseadas em propriedades de chaveamento ou reconhecimento molecular. Com esse escopo, os químicos inorgânicos em particular, podem aplica...
متن کاملArquitectura Empresarial e Sistemas de Gestão da Qualidade
Muito tem sido dito acerca da crescente necessidade das organizações serem flexíveis e dinâmicas. Para conseguir este dinamismo, as organizações têm que se estruturar internamente em torno de elementos flexíveis e dinâmicos e dotar-se de mecanismos que assegurem a coerência e o alinhamento entre os vários elementos, que a compõem, à medida que estes se vão modificando. Como exemplo de elementos...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- RITA
دوره 17 شماره
صفحات -
تاریخ انتشار 2010